Bayesian inference is facilitated by modular neural networks with different time scales | Plos computational biology (2024)
Kohei Ichikawa, Kunihiko Kaneko
https://doi.org/10.1371/journal.pcbi.1011897
hl.icon
脳はどのようなメカニズムでベイズ推論(Bayesian Inference)を行っているのか?
Naa_tsure.iconベイズ脳(Bayesian brain)仮説に対するRNNを用いた理論的なアプローチ
ベイズ脳仮説では、脳(神経系)は過去の観測(経験)から事前分布(Prior)を形成しているはずである
過去の観測に関する情報を保持するということは、長い時間スケールを持つ細胞が関与している可能性がある
脳における事前分布について
実際、脳の中の活動は領域/細胞によってタイムスケールが異なっている
脳におけるマルチタイムスケール
RNNのモデル
$ x(t+1) = (1 - \alpha)x(t) + \alpha \text{ReLU}(W_{in}u(t) + Wx(t)) + \sqrt{\alpha_{m}}\xi_{m}
$ u(t):入力層
$ x(t):隠れ層
$ \alpha:タイムスケールの制御パラメータ
活性化関数:ReLU
全体のユニット数:200個
早いタイムスケールのユニット数:150個
$ x_{m}(t + 1) = (1 - \alpha_{m})x_{m}(t) + \alpha_{m}\text{ReLU}(W_{in}u(t) + W_{main}x_{m}(t) + W_{s \rightarrow m}x_{s}(t)) + \sqrt{\alpha_{m}}\xi_{m}
遅いタイムスケールのユニット数:50個
$ x_{s}(t + 1) = (1 - \alpha_{s})x_{s}(t) + \alpha_{s}\text{ReLU}(W_{sub}x_{s}(t) + W_{m \rightarrow s}x_m(t)) + \sqrt{\alpha_{s}}\xi_{s}
通時的誤差逆伝播法(Backpropagation Through Time; BPTT)
adam
遅いタイムスケールの神経ユニットが事前分布(Prior)を表現していた
またタイムスケールを可変なネットワークにおいても同様の結果が得られた
Naa_tsure.icon内部状態が出力に与える影響を調べる方法が疑問
ここでいう固定とは?
Naa_tsure.iconPCAでの内部状態の評価どうなんでしょう…?
PCAでlatent dynamicsを語ってよいのか